iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 17
0

機器學習預訓練模型API - Vision API

接下來的四篇文章,將分別介紹課程中提及的四個Google Cloud Platform上提供的機器學習預訓練模型API,透過這些預訓練模型加上以呼叫API的方式進行使用,我們能夠快速方便地享受到經由Google結合自身大量資料與堅實機器學習實力所訓練出來的模型,在我們欲達成的任務上取得優良的成果。

首先第一篇文章要介紹的是Vision API(註1),電腦視覺領域可說是在機器學習的應用上發展地最快速的領域之一,比如**光學文字辨識(Optical Character Recognition, OCR)物體偵測(Object Detection)**等應用,都為我們的生活帶來許多進步與方便之處。

透過Google Cloud Platform的Vision API,我們可以完成以下工作(非涵蓋全部Vision API功能,在此以列舉課程中提到的功能為主):

  • Label & Web detection: 辨識圖片中的物體為何與搜尋網路上相似物體的圖片,並回傳那些圖片的來源之內容,藉以為原始圖片增加更多描述細節
  • OCR: 光學文字辨識
  • Logo detection: 辨識圖片中的公司商標
  • Landmark detection: 辨識圖片中的知名地標
  • Crop hints: 剪裁提示

在實際的商業應用上,知名的GIF搜尋引擎公司Giphy(註2),就有使用Vision API當中的OCR功能,來增進其搜尋體驗。(註3)

註1: https://cloud.google.com/vision/
註2: https://giphy.com/
註3: https://engineering.giphy.com/enhancing-giphy-search-with-google-cloud-ml-tools/


上一篇
Day 16 - How Google does Machine Learning (15)
下一篇
Day 18 - How Google does Machine Learning (17)
系列文
Understanding and Applying Machine Learning with Google Cloud Platform30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言